National Repository of Grey Literature 16 records found  1 - 10next  jump to record: Search took 0.02 seconds. 
Application of count data models
Reichmanová, Barbora ; Hampel,, David (referee) ; Hübnerová, Zuzana (advisor)
Při analýze dat růstu rostlin v řádku dané délky bychom měli uvažovat jak pravděpodobnost, že semínko zdárně vyroste, tak i náhodný počet semínek, které byly zasety. Proto se v celé práci věnujeme analýze náhodných sum, kde počet nezávisle stejně rozdělených sčítanců je na nich nezávislé náhodné číslo. První část práce věnuje pozornost teoretickému základu, definuje pojem náhodná suma a uvádí vlastnosti, jako jsou číslené míry polohy nebo funkční charakteristiky popisující dané rozdělení. Následně je diskutována metoda odhadu parametrů pomocí maximální věrohodnosti a zobecněné lineární modely. Metoda kvazi-věrohodnosti je též krátce zmíněna. Tato část je ilustrována příklady souvisejícími s výchozím problémem. Poslední kapitola se věnuje aplikaci na reálných datech a následné analýze.
Linear Logistic Regression Demo
Bak, Adam ; Kesiraju, Santosh (referee) ; Beneš, Karel (advisor)
This bachelor's thesis deals with the machine learning model logistic regression.The aim is to closely inspect and analyze the workings of this model for classification, in order to be able to provide a learning tool in the form of demonstrative application. All of the mathematical formulae, logistic sigmoid, cross entropy error function and gradient are derived and explained in a concise manner. This thesis also provides some insight into the form of the cross entropy error function in the case of linear logistic regression.
Methods for class prediction with high-dimensional gene expression data
Šilhavá, Jana ; Matula, Petr (referee) ; Železný, Filip (referee) ; Smrž, Pavel (advisor)
Dizertační práce se zabývá predikcí vysokodimenzionálních dat genových expresí. Množství dostupných genomických dat významně vzrostlo v průběhu posledního desetiletí. Kombinování dat genových expresí s dalšími daty nachází uplatnění v mnoha oblastech. Například v klinickém řízení rakoviny (clinical cancer management) může přispět k přesnějšímu určení prognózy nemocí. Hlavní část této dizertační práce je zaměřena na kombinování dat genových expresí a klinických dat. Používáme logistické regresní modely vytvořené prostřednictvím různých regularizačních technik. Generalizované lineární modely umožňují kombinování modelů s různou strukturou dat. V dizertační práci je ukázáno, že kombinování modelu dat genových expresí a klinických dat může vést ke zpřesnění výsledku predikce oproti vytvoření modelu pouze z dat genových expresí nebo klinických dat. Navrhované postupy přitom nejsou výpočetně náročné.  Testování je provedeno nejprve se simulovanými datovými sadami v různých nastaveních a následně s~reálnými srovnávacími daty. Také se zde zabýváme určením přídavné hodnoty microarray dat. Dizertační práce obsahuje porovnání příznaků vybraných pomocí klasifikátoru genových expresí na pěti různých sadách dat týkajících se rakoviny prsu. Navrhujeme také postup výběru příznaků, který kombinuje data genových expresí a znalosti z genových ontologií.
Statistical models for prediction of project duration
Oberta, Dušan ; Žák, Libor (referee) ; Hübnerová, Zuzana (advisor)
Cieľom tejto bakalárskej práce je odvodiť štatistické modely vhodné pre analýzu dát a aplikovať ich na analýzu reálnych dát týkajúcich sa časovej náročnosti projektov v závislosti na charakteristikách projektov. V úvodnej kapitole sú študované lineárne regresné modely založené na metóde najmenších štvorcov, vrátane ich vlastností a predikčných intervalov. Nasleduje kapitola zaoberajúca sa problematikou zobecnených lineárnych modelov založených na metóde maximálnej vierohodnosti, ich vlastností a zostavením asymptotických konfidenčných intervalov pre stredné hodnoty. Ďalšia kapitola sa zaoberá problematikou regresných stromov, kde sú znova ukázané metóda najmenších štvrocov a metóda maximálnej vierohodnosti. Boli ukázané základné princípy orezávania regresných stromov a odvodenie konfidenčných intervalov pre stredné hodnoty. Metóda maximálnej vierohodnosti pre regresné stromy a odvodenie konfidenčných intervalov boli z podstatnej časti vlastným odvodením autora. Posledným študovaným modelom sú náhodné lesy, vrátane ich základných vlastností a konfidenčných intervalov pre stredné hodnoty. V týchto kapitolách boli taktiež ukázané metódy posúdenia kvality modelu, výberu optimálneho podmodelu, poprípade určenia optimálnych hodnôt rôznych parametrov. Na záver sú dané modely a algoritmy implementované v jazyku Python a aplikované na reálne dáta.
Klíčivost semen, metody stanovení a její ovlivnění faktory prostředí
KRAUS, Jindřich
We compared germination rate and germination dynamics of species under different seed stratification treatments (dry, wet, temperature variation). The experiment was performed in laboratory conditions using seeds of ten species from commercial sales. The home site advantage was tested in a field experiment assessing seed germination of three species from four localities differing in moisture and seeds from commercial sales. We analysed the data using generalized linear models.
Statistical models for capital models of insurance companies
Švagerková, Lýdia ; Šimurda, Miroslav (advisor) ; Mazurová, Lucie (referee)
This work deals with the topic of lapse rate modelling in the field of Life Insurance. First, the theoretical apparatus is established: the linear models and their extension, generalized linear models. Furthermore, we describe the process of model selection and evaluation. In the second part of this work we describe the influence of various individual as well as macroeconomical parameters on the lapse rate. We summarize the findings of previous works in this field. The last part introduces models in statistical software R based on generalized linear models and describes the process of their selection and evaluation. Outputs from these models are interpreted and compared to the ratio analysis results.
Application of count data models
Reichmanová, Barbora ; Hampel,, David (referee) ; Hübnerová, Zuzana (advisor)
Při analýze dat růstu rostlin v řádku dané délky bychom měli uvažovat jak pravděpodobnost, že semínko zdárně vyroste, tak i náhodný počet semínek, které byly zasety. Proto se v celé práci věnujeme analýze náhodných sum, kde počet nezávisle stejně rozdělených sčítanců je na nich nezávislé náhodné číslo. První část práce věnuje pozornost teoretickému základu, definuje pojem náhodná suma a uvádí vlastnosti, jako jsou číslené míry polohy nebo funkční charakteristiky popisující dané rozdělení. Následně je diskutována metoda odhadu parametrů pomocí maximální věrohodnosti a zobecněné lineární modely. Metoda kvazi-věrohodnosti je též krátce zmíněna. Tato část je ilustrována příklady souvisejícími s výchozím problémem. Poslední kapitola se věnuje aplikaci na reálných datech a následné analýze.
Linear Logistic Regression Demo
Bak, Adam ; Kesiraju, Santosh (referee) ; Beneš, Karel (advisor)
This bachelor's thesis deals with the machine learning model logistic regression.The aim is to closely inspect and analyze the workings of this model for classification, in order to be able to provide a learning tool in the form of demonstrative application. All of the mathematical formulae, logistic sigmoid, cross entropy error function and gradient are derived and explained in a concise manner. This thesis also provides some insight into the form of the cross entropy error function in the case of linear logistic regression.
Tweedie models for pricing and reserving
Smolárová, Tereza ; Pešta, Michal (advisor) ; Cipra, Tomáš (referee)
This presented thesis deals with applications of Tweedie compound Poisson model in non-life insurance pricing and claims reserving. Tweedie models are exponen- tial dispersion models with power mean-variance relationships and compound Poisson distribution is a particular Tweedie model. The interest in Tweedie com- pound Poisson model is motivated by its applications to generalized linear models (GLMs) and generalized estimation equations (GEE). The purpose of this thesis is to construct pricing and claims reserving models in which the response variables follow Tweedie compound Poisson model. Theoretical approaches are applied on the real datasets. 1
Generalized Linear Models in Reserving Risk
Zboňáková, Lenka ; Pešta, Michal (advisor) ; Branda, Martin (referee)
In the presented thesis we deal with the generalized linear models framework in a claims reserving problem. Claims reserving in non-life insurance is firstly described and the considered class of models is introduced. Consequently, this branch of stochastic modelling is implemented in the reserving setup. For computation of the risk associated with claims reserving, we need a predictive distribution of future liabilities in order to evaluate risk measures such as Va- lue at Risk and Conditional Value at Risk. Since datasets in non-life insurance commonly consist of a small number of observations and estimation of predictive distributions can be complicated, we adopt a bootstrap method for this purpose. Model fitting, simulations and consequent measuring of the reserving risk are performed within the use of real-life data. Based on this, an analysis of fitted models and their comparison together with graphical outputs is included. 1

National Repository of Grey Literature : 16 records found   1 - 10next  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.